You are currently looking at version 1.1 of this notebook. To download notebooks and datafiles, as well as get help on Jupyter notebooks in the Coursera platform, visit the Jupyter Notebook FAQ course resource.


Assignment 1 - Introduction to Machine Learning

For this assignment, you will be using the Breast Cancer Wisconsin (Diagnostic) Database to create a classifier that can help diagnose patients. First, read through the description of the dataset (below).


In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer

cancer = load_breast_cancer()

#print(cancer.DESCR) # Print the data set description
cancer

The object returned by load_breast_cancer() is a scikit-learn Bunch object, which is similar to a dictionary.


In [2]:
cancer.keys()


Out[2]:
dict_keys(['DESCR', 'target_names', 'feature_names', 'target', 'data'])

Question 0 (Example)

How many features does the breast cancer dataset have?

This function should return an integer.


In [3]:
# You should write your whole answer within the function provided. The autograder will call
# this function and compare the return value against the correct solution value
def answer_zero():
    # This function returns the number of features of the breast cancer dataset, which is an integer. 
    # The assignment question description will tell you the general format the autograder is expecting
    return len(cancer['feature_names'])

# You can examine what your function returns by calling it in the cell. If you have questions
# about the assignment formats, check out the discussion forums for any FAQs
answer_zero()


Out[3]:
30

Question 1

Scikit-learn works with lists, numpy arrays, scipy-sparse matrices, and pandas DataFrames, so converting the dataset to a DataFrame is not necessary for training this model. Using a DataFrame does however help make many things easier such as munging data, so let's practice creating a classifier with a pandas DataFrame.

Convert the sklearn.dataset cancer to a DataFrame.

This function should return a (569, 31) DataFrame with

columns =

['mean radius', 'mean texture', 'mean perimeter', 'mean area',
'mean smoothness', 'mean compactness', 'mean concavity',
'mean concave points', 'mean symmetry', 'mean fractal dimension',
'radius error', 'texture error', 'perimeter error', 'area error',
'smoothness error', 'compactness error', 'concavity error',
'concave points error', 'symmetry error', 'fractal dimension error',
'worst radius', 'worst texture', 'worst perimeter', 'worst area',
'worst smoothness', 'worst compactness', 'worst concavity',
'worst concave points', 'worst symmetry', 'worst fractal dimension',
'target']

and index =

RangeIndex(start=0, stop=569, step=1)

In [7]:
def answer_one():
    
    df = pd.DataFrame(data=cancer['data'], columns=cancer['feature_names'])
    df['target'] = cancer['target']
    
    return df


answer_one()


Out[7]:
mean radius mean texture mean perimeter mean area mean smoothness mean compactness mean concavity mean concave points mean symmetry mean fractal dimension ... worst texture worst perimeter worst area worst smoothness worst compactness worst concavity worst concave points worst symmetry worst fractal dimension target
0 17.990 10.38 122.80 1001.0 0.11840 0.27760 0.300100 0.147100 0.2419 0.07871 ... 17.33 184.60 2019.0 0.16220 0.66560 0.71190 0.26540 0.4601 0.11890 0
1 20.570 17.77 132.90 1326.0 0.08474 0.07864 0.086900 0.070170 0.1812 0.05667 ... 23.41 158.80 1956.0 0.12380 0.18660 0.24160 0.18600 0.2750 0.08902 0
2 19.690 21.25 130.00 1203.0 0.10960 0.15990 0.197400 0.127900 0.2069 0.05999 ... 25.53 152.50 1709.0 0.14440 0.42450 0.45040 0.24300 0.3613 0.08758 0
3 11.420 20.38 77.58 386.1 0.14250 0.28390 0.241400 0.105200 0.2597 0.09744 ... 26.50 98.87 567.7 0.20980 0.86630 0.68690 0.25750 0.6638 0.17300 0
4 20.290 14.34 135.10 1297.0 0.10030 0.13280 0.198000 0.104300 0.1809 0.05883 ... 16.67 152.20 1575.0 0.13740 0.20500 0.40000 0.16250 0.2364 0.07678 0
5 12.450 15.70 82.57 477.1 0.12780 0.17000 0.157800 0.080890 0.2087 0.07613 ... 23.75 103.40 741.6 0.17910 0.52490 0.53550 0.17410 0.3985 0.12440 0
6 18.250 19.98 119.60 1040.0 0.09463 0.10900 0.112700 0.074000 0.1794 0.05742 ... 27.66 153.20 1606.0 0.14420 0.25760 0.37840 0.19320 0.3063 0.08368 0
7 13.710 20.83 90.20 577.9 0.11890 0.16450 0.093660 0.059850 0.2196 0.07451 ... 28.14 110.60 897.0 0.16540 0.36820 0.26780 0.15560 0.3196 0.11510 0
8 13.000 21.82 87.50 519.8 0.12730 0.19320 0.185900 0.093530 0.2350 0.07389 ... 30.73 106.20 739.3 0.17030 0.54010 0.53900 0.20600 0.4378 0.10720 0
9 12.460 24.04 83.97 475.9 0.11860 0.23960 0.227300 0.085430 0.2030 0.08243 ... 40.68 97.65 711.4 0.18530 1.05800 1.10500 0.22100 0.4366 0.20750 0
10 16.020 23.24 102.70 797.8 0.08206 0.06669 0.032990 0.033230 0.1528 0.05697 ... 33.88 123.80 1150.0 0.11810 0.15510 0.14590 0.09975 0.2948 0.08452 0
11 15.780 17.89 103.60 781.0 0.09710 0.12920 0.099540 0.066060 0.1842 0.06082 ... 27.28 136.50 1299.0 0.13960 0.56090 0.39650 0.18100 0.3792 0.10480 0
12 19.170 24.80 132.40 1123.0 0.09740 0.24580 0.206500 0.111800 0.2397 0.07800 ... 29.94 151.70 1332.0 0.10370 0.39030 0.36390 0.17670 0.3176 0.10230 0
13 15.850 23.95 103.70 782.7 0.08401 0.10020 0.099380 0.053640 0.1847 0.05338 ... 27.66 112.00 876.5 0.11310 0.19240 0.23220 0.11190 0.2809 0.06287 0
14 13.730 22.61 93.60 578.3 0.11310 0.22930 0.212800 0.080250 0.2069 0.07682 ... 32.01 108.80 697.7 0.16510 0.77250 0.69430 0.22080 0.3596 0.14310 0
15 14.540 27.54 96.73 658.8 0.11390 0.15950 0.163900 0.073640 0.2303 0.07077 ... 37.13 124.10 943.2 0.16780 0.65770 0.70260 0.17120 0.4218 0.13410 0
16 14.680 20.13 94.74 684.5 0.09867 0.07200 0.073950 0.052590 0.1586 0.05922 ... 30.88 123.40 1138.0 0.14640 0.18710 0.29140 0.16090 0.3029 0.08216 0
17 16.130 20.68 108.10 798.8 0.11700 0.20220 0.172200 0.102800 0.2164 0.07356 ... 31.48 136.80 1315.0 0.17890 0.42330 0.47840 0.20730 0.3706 0.11420 0
18 19.810 22.15 130.00 1260.0 0.09831 0.10270 0.147900 0.094980 0.1582 0.05395 ... 30.88 186.80 2398.0 0.15120 0.31500 0.53720 0.23880 0.2768 0.07615 0
19 13.540 14.36 87.46 566.3 0.09779 0.08129 0.066640 0.047810 0.1885 0.05766 ... 19.26 99.70 711.2 0.14400 0.17730 0.23900 0.12880 0.2977 0.07259 1
20 13.080 15.71 85.63 520.0 0.10750 0.12700 0.045680 0.031100 0.1967 0.06811 ... 20.49 96.09 630.5 0.13120 0.27760 0.18900 0.07283 0.3184 0.08183 1
21 9.504 12.44 60.34 273.9 0.10240 0.06492 0.029560 0.020760 0.1815 0.06905 ... 15.66 65.13 314.9 0.13240 0.11480 0.08867 0.06227 0.2450 0.07773 1
22 15.340 14.26 102.50 704.4 0.10730 0.21350 0.207700 0.097560 0.2521 0.07032 ... 19.08 125.10 980.9 0.13900 0.59540 0.63050 0.23930 0.4667 0.09946 0
23 21.160 23.04 137.20 1404.0 0.09428 0.10220 0.109700 0.086320 0.1769 0.05278 ... 35.59 188.00 2615.0 0.14010 0.26000 0.31550 0.20090 0.2822 0.07526 0
24 16.650 21.38 110.00 904.6 0.11210 0.14570 0.152500 0.091700 0.1995 0.06330 ... 31.56 177.00 2215.0 0.18050 0.35780 0.46950 0.20950 0.3613 0.09564 0
25 17.140 16.40 116.00 912.7 0.11860 0.22760 0.222900 0.140100 0.3040 0.07413 ... 21.40 152.40 1461.0 0.15450 0.39490 0.38530 0.25500 0.4066 0.10590 0
26 14.580 21.53 97.41 644.8 0.10540 0.18680 0.142500 0.087830 0.2252 0.06924 ... 33.21 122.40 896.9 0.15250 0.66430 0.55390 0.27010 0.4264 0.12750 0
27 18.610 20.25 122.10 1094.0 0.09440 0.10660 0.149000 0.077310 0.1697 0.05699 ... 27.26 139.90 1403.0 0.13380 0.21170 0.34460 0.14900 0.2341 0.07421 0
28 15.300 25.27 102.40 732.4 0.10820 0.16970 0.168300 0.087510 0.1926 0.06540 ... 36.71 149.30 1269.0 0.16410 0.61100 0.63350 0.20240 0.4027 0.09876 0
29 17.570 15.05 115.00 955.1 0.09847 0.11570 0.098750 0.079530 0.1739 0.06149 ... 19.52 134.90 1227.0 0.12550 0.28120 0.24890 0.14560 0.2756 0.07919 0
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
539 7.691 25.44 48.34 170.4 0.08668 0.11990 0.092520 0.013640 0.2037 0.07751 ... 31.89 54.49 223.6 0.15960 0.30640 0.33930 0.05000 0.2790 0.10660 1
540 11.540 14.44 74.65 402.9 0.09984 0.11200 0.067370 0.025940 0.1818 0.06782 ... 19.68 78.78 457.8 0.13450 0.21180 0.17970 0.06918 0.2329 0.08134 1
541 14.470 24.99 95.81 656.4 0.08837 0.12300 0.100900 0.038900 0.1872 0.06341 ... 31.73 113.50 808.9 0.13400 0.42020 0.40400 0.12050 0.3187 0.10230 1
542 14.740 25.42 94.70 668.6 0.08275 0.07214 0.041050 0.030270 0.1840 0.05680 ... 32.29 107.40 826.4 0.10600 0.13760 0.16110 0.10950 0.2722 0.06956 1
543 13.210 28.06 84.88 538.4 0.08671 0.06877 0.029870 0.032750 0.1628 0.05781 ... 37.17 92.48 629.6 0.10720 0.13810 0.10620 0.07958 0.2473 0.06443 1
544 13.870 20.70 89.77 584.8 0.09578 0.10180 0.036880 0.023690 0.1620 0.06688 ... 24.75 99.17 688.6 0.12640 0.20370 0.13770 0.06845 0.2249 0.08492 1
545 13.620 23.23 87.19 573.2 0.09246 0.06747 0.029740 0.024430 0.1664 0.05801 ... 29.09 97.58 729.8 0.12160 0.15170 0.10490 0.07174 0.2642 0.06953 1
546 10.320 16.35 65.31 324.9 0.09434 0.04994 0.010120 0.005495 0.1885 0.06201 ... 21.77 71.12 384.9 0.12850 0.08842 0.04384 0.02381 0.2681 0.07399 1
547 10.260 16.58 65.85 320.8 0.08877 0.08066 0.043580 0.024380 0.1669 0.06714 ... 22.04 71.08 357.4 0.14610 0.22460 0.17830 0.08333 0.2691 0.09479 1
548 9.683 19.34 61.05 285.7 0.08491 0.05030 0.023370 0.009615 0.1580 0.06235 ... 25.59 69.10 364.2 0.11990 0.09546 0.09350 0.03846 0.2552 0.07920 1
549 10.820 24.21 68.89 361.6 0.08192 0.06602 0.015480 0.008160 0.1976 0.06328 ... 31.45 83.90 505.6 0.12040 0.16330 0.06194 0.03264 0.3059 0.07626 1
550 10.860 21.48 68.51 360.5 0.07431 0.04227 0.000000 0.000000 0.1661 0.05948 ... 24.77 74.08 412.3 0.10010 0.07348 0.00000 0.00000 0.2458 0.06592 1
551 11.130 22.44 71.49 378.4 0.09566 0.08194 0.048240 0.022570 0.2030 0.06552 ... 28.26 77.80 436.6 0.10870 0.17820 0.15640 0.06413 0.3169 0.08032 1
552 12.770 29.43 81.35 507.9 0.08276 0.04234 0.019970 0.014990 0.1539 0.05637 ... 36.00 88.10 594.7 0.12340 0.10640 0.08653 0.06498 0.2407 0.06484 1
553 9.333 21.94 59.01 264.0 0.09240 0.05605 0.039960 0.012820 0.1692 0.06576 ... 25.05 62.86 295.8 0.11030 0.08298 0.07993 0.02564 0.2435 0.07393 1
554 12.880 28.92 82.50 514.3 0.08123 0.05824 0.061950 0.023430 0.1566 0.05708 ... 35.74 88.84 595.7 0.12270 0.16200 0.24390 0.06493 0.2372 0.07242 1
555 10.290 27.61 65.67 321.4 0.09030 0.07658 0.059990 0.027380 0.1593 0.06127 ... 34.91 69.57 357.6 0.13840 0.17100 0.20000 0.09127 0.2226 0.08283 1
556 10.160 19.59 64.73 311.7 0.10030 0.07504 0.005025 0.011160 0.1791 0.06331 ... 22.88 67.88 347.3 0.12650 0.12000 0.01005 0.02232 0.2262 0.06742 1
557 9.423 27.88 59.26 271.3 0.08123 0.04971 0.000000 0.000000 0.1742 0.06059 ... 34.24 66.50 330.6 0.10730 0.07158 0.00000 0.00000 0.2475 0.06969 1
558 14.590 22.68 96.39 657.1 0.08473 0.13300 0.102900 0.037360 0.1454 0.06147 ... 27.27 105.90 733.5 0.10260 0.31710 0.36620 0.11050 0.2258 0.08004 1
559 11.510 23.93 74.52 403.5 0.09261 0.10210 0.111200 0.041050 0.1388 0.06570 ... 37.16 82.28 474.2 0.12980 0.25170 0.36300 0.09653 0.2112 0.08732 1
560 14.050 27.15 91.38 600.4 0.09929 0.11260 0.044620 0.043040 0.1537 0.06171 ... 33.17 100.20 706.7 0.12410 0.22640 0.13260 0.10480 0.2250 0.08321 1
561 11.200 29.37 70.67 386.0 0.07449 0.03558 0.000000 0.000000 0.1060 0.05502 ... 38.30 75.19 439.6 0.09267 0.05494 0.00000 0.00000 0.1566 0.05905 1
562 15.220 30.62 103.40 716.9 0.10480 0.20870 0.255000 0.094290 0.2128 0.07152 ... 42.79 128.70 915.0 0.14170 0.79170 1.17000 0.23560 0.4089 0.14090 0
563 20.920 25.09 143.00 1347.0 0.10990 0.22360 0.317400 0.147400 0.2149 0.06879 ... 29.41 179.10 1819.0 0.14070 0.41860 0.65990 0.25420 0.2929 0.09873 0
564 21.560 22.39 142.00 1479.0 0.11100 0.11590 0.243900 0.138900 0.1726 0.05623 ... 26.40 166.10 2027.0 0.14100 0.21130 0.41070 0.22160 0.2060 0.07115 0
565 20.130 28.25 131.20 1261.0 0.09780 0.10340 0.144000 0.097910 0.1752 0.05533 ... 38.25 155.00 1731.0 0.11660 0.19220 0.32150 0.16280 0.2572 0.06637 0
566 16.600 28.08 108.30 858.1 0.08455 0.10230 0.092510 0.053020 0.1590 0.05648 ... 34.12 126.70 1124.0 0.11390 0.30940 0.34030 0.14180 0.2218 0.07820 0
567 20.600 29.33 140.10 1265.0 0.11780 0.27700 0.351400 0.152000 0.2397 0.07016 ... 39.42 184.60 1821.0 0.16500 0.86810 0.93870 0.26500 0.4087 0.12400 0
568 7.760 24.54 47.92 181.0 0.05263 0.04362 0.000000 0.000000 0.1587 0.05884 ... 30.37 59.16 268.6 0.08996 0.06444 0.00000 0.00000 0.2871 0.07039 1

569 rows × 31 columns

Question 2

What is the class distribution? (i.e. how many instances of malignant (encoded 0) and how many benign (encoded 1)?)

This function should return a Series named target of length 2 with integer values and index = ['malignant', 'benign']


In [9]:
def answer_two():
    cancerdf = answer_one()
    
    malignant = (cancerdf['target']==0).sum()
    benign = (cancerdf['target']==1).sum()
    ans = [malignant, benign]
    
    return ans


answer_two()


Out[9]:
[212, 357]

Question 3

Split the DataFrame into X (the data) and y (the labels).

This function should return a tuple of length 2: (X, y), where

  • X has shape (569, 30)
  • y has shape (569,).

In [25]:
cancerdf = answer_one()
cancerdf.iloc[:, :-1]


Out[25]:
mean radius mean texture mean perimeter mean area mean smoothness mean compactness mean concavity mean concave points mean symmetry mean fractal dimension ... worst radius worst texture worst perimeter worst area worst smoothness worst compactness worst concavity worst concave points worst symmetry worst fractal dimension
0 17.990 10.38 122.80 1001.0 0.11840 0.27760 0.300100 0.147100 0.2419 0.07871 ... 25.380 17.33 184.60 2019.0 0.16220 0.66560 0.71190 0.26540 0.4601 0.11890
1 20.570 17.77 132.90 1326.0 0.08474 0.07864 0.086900 0.070170 0.1812 0.05667 ... 24.990 23.41 158.80 1956.0 0.12380 0.18660 0.24160 0.18600 0.2750 0.08902
2 19.690 21.25 130.00 1203.0 0.10960 0.15990 0.197400 0.127900 0.2069 0.05999 ... 23.570 25.53 152.50 1709.0 0.14440 0.42450 0.45040 0.24300 0.3613 0.08758
3 11.420 20.38 77.58 386.1 0.14250 0.28390 0.241400 0.105200 0.2597 0.09744 ... 14.910 26.50 98.87 567.7 0.20980 0.86630 0.68690 0.25750 0.6638 0.17300
4 20.290 14.34 135.10 1297.0 0.10030 0.13280 0.198000 0.104300 0.1809 0.05883 ... 22.540 16.67 152.20 1575.0 0.13740 0.20500 0.40000 0.16250 0.2364 0.07678
5 12.450 15.70 82.57 477.1 0.12780 0.17000 0.157800 0.080890 0.2087 0.07613 ... 15.470 23.75 103.40 741.6 0.17910 0.52490 0.53550 0.17410 0.3985 0.12440
6 18.250 19.98 119.60 1040.0 0.09463 0.10900 0.112700 0.074000 0.1794 0.05742 ... 22.880 27.66 153.20 1606.0 0.14420 0.25760 0.37840 0.19320 0.3063 0.08368
7 13.710 20.83 90.20 577.9 0.11890 0.16450 0.093660 0.059850 0.2196 0.07451 ... 17.060 28.14 110.60 897.0 0.16540 0.36820 0.26780 0.15560 0.3196 0.11510
8 13.000 21.82 87.50 519.8 0.12730 0.19320 0.185900 0.093530 0.2350 0.07389 ... 15.490 30.73 106.20 739.3 0.17030 0.54010 0.53900 0.20600 0.4378 0.10720
9 12.460 24.04 83.97 475.9 0.11860 0.23960 0.227300 0.085430 0.2030 0.08243 ... 15.090 40.68 97.65 711.4 0.18530 1.05800 1.10500 0.22100 0.4366 0.20750
10 16.020 23.24 102.70 797.8 0.08206 0.06669 0.032990 0.033230 0.1528 0.05697 ... 19.190 33.88 123.80 1150.0 0.11810 0.15510 0.14590 0.09975 0.2948 0.08452
11 15.780 17.89 103.60 781.0 0.09710 0.12920 0.099540 0.066060 0.1842 0.06082 ... 20.420 27.28 136.50 1299.0 0.13960 0.56090 0.39650 0.18100 0.3792 0.10480
12 19.170 24.80 132.40 1123.0 0.09740 0.24580 0.206500 0.111800 0.2397 0.07800 ... 20.960 29.94 151.70 1332.0 0.10370 0.39030 0.36390 0.17670 0.3176 0.10230
13 15.850 23.95 103.70 782.7 0.08401 0.10020 0.099380 0.053640 0.1847 0.05338 ... 16.840 27.66 112.00 876.5 0.11310 0.19240 0.23220 0.11190 0.2809 0.06287
14 13.730 22.61 93.60 578.3 0.11310 0.22930 0.212800 0.080250 0.2069 0.07682 ... 15.030 32.01 108.80 697.7 0.16510 0.77250 0.69430 0.22080 0.3596 0.14310
15 14.540 27.54 96.73 658.8 0.11390 0.15950 0.163900 0.073640 0.2303 0.07077 ... 17.460 37.13 124.10 943.2 0.16780 0.65770 0.70260 0.17120 0.4218 0.13410
16 14.680 20.13 94.74 684.5 0.09867 0.07200 0.073950 0.052590 0.1586 0.05922 ... 19.070 30.88 123.40 1138.0 0.14640 0.18710 0.29140 0.16090 0.3029 0.08216
17 16.130 20.68 108.10 798.8 0.11700 0.20220 0.172200 0.102800 0.2164 0.07356 ... 20.960 31.48 136.80 1315.0 0.17890 0.42330 0.47840 0.20730 0.3706 0.11420
18 19.810 22.15 130.00 1260.0 0.09831 0.10270 0.147900 0.094980 0.1582 0.05395 ... 27.320 30.88 186.80 2398.0 0.15120 0.31500 0.53720 0.23880 0.2768 0.07615
19 13.540 14.36 87.46 566.3 0.09779 0.08129 0.066640 0.047810 0.1885 0.05766 ... 15.110 19.26 99.70 711.2 0.14400 0.17730 0.23900 0.12880 0.2977 0.07259
20 13.080 15.71 85.63 520.0 0.10750 0.12700 0.045680 0.031100 0.1967 0.06811 ... 14.500 20.49 96.09 630.5 0.13120 0.27760 0.18900 0.07283 0.3184 0.08183
21 9.504 12.44 60.34 273.9 0.10240 0.06492 0.029560 0.020760 0.1815 0.06905 ... 10.230 15.66 65.13 314.9 0.13240 0.11480 0.08867 0.06227 0.2450 0.07773
22 15.340 14.26 102.50 704.4 0.10730 0.21350 0.207700 0.097560 0.2521 0.07032 ... 18.070 19.08 125.10 980.9 0.13900 0.59540 0.63050 0.23930 0.4667 0.09946
23 21.160 23.04 137.20 1404.0 0.09428 0.10220 0.109700 0.086320 0.1769 0.05278 ... 29.170 35.59 188.00 2615.0 0.14010 0.26000 0.31550 0.20090 0.2822 0.07526
24 16.650 21.38 110.00 904.6 0.11210 0.14570 0.152500 0.091700 0.1995 0.06330 ... 26.460 31.56 177.00 2215.0 0.18050 0.35780 0.46950 0.20950 0.3613 0.09564
25 17.140 16.40 116.00 912.7 0.11860 0.22760 0.222900 0.140100 0.3040 0.07413 ... 22.250 21.40 152.40 1461.0 0.15450 0.39490 0.38530 0.25500 0.4066 0.10590
26 14.580 21.53 97.41 644.8 0.10540 0.18680 0.142500 0.087830 0.2252 0.06924 ... 17.620 33.21 122.40 896.9 0.15250 0.66430 0.55390 0.27010 0.4264 0.12750
27 18.610 20.25 122.10 1094.0 0.09440 0.10660 0.149000 0.077310 0.1697 0.05699 ... 21.310 27.26 139.90 1403.0 0.13380 0.21170 0.34460 0.14900 0.2341 0.07421
28 15.300 25.27 102.40 732.4 0.10820 0.16970 0.168300 0.087510 0.1926 0.06540 ... 20.270 36.71 149.30 1269.0 0.16410 0.61100 0.63350 0.20240 0.4027 0.09876
29 17.570 15.05 115.00 955.1 0.09847 0.11570 0.098750 0.079530 0.1739 0.06149 ... 20.010 19.52 134.90 1227.0 0.12550 0.28120 0.24890 0.14560 0.2756 0.07919
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
539 7.691 25.44 48.34 170.4 0.08668 0.11990 0.092520 0.013640 0.2037 0.07751 ... 8.678 31.89 54.49 223.6 0.15960 0.30640 0.33930 0.05000 0.2790 0.10660
540 11.540 14.44 74.65 402.9 0.09984 0.11200 0.067370 0.025940 0.1818 0.06782 ... 12.260 19.68 78.78 457.8 0.13450 0.21180 0.17970 0.06918 0.2329 0.08134
541 14.470 24.99 95.81 656.4 0.08837 0.12300 0.100900 0.038900 0.1872 0.06341 ... 16.220 31.73 113.50 808.9 0.13400 0.42020 0.40400 0.12050 0.3187 0.10230
542 14.740 25.42 94.70 668.6 0.08275 0.07214 0.041050 0.030270 0.1840 0.05680 ... 16.510 32.29 107.40 826.4 0.10600 0.13760 0.16110 0.10950 0.2722 0.06956
543 13.210 28.06 84.88 538.4 0.08671 0.06877 0.029870 0.032750 0.1628 0.05781 ... 14.370 37.17 92.48 629.6 0.10720 0.13810 0.10620 0.07958 0.2473 0.06443
544 13.870 20.70 89.77 584.8 0.09578 0.10180 0.036880 0.023690 0.1620 0.06688 ... 15.050 24.75 99.17 688.6 0.12640 0.20370 0.13770 0.06845 0.2249 0.08492
545 13.620 23.23 87.19 573.2 0.09246 0.06747 0.029740 0.024430 0.1664 0.05801 ... 15.350 29.09 97.58 729.8 0.12160 0.15170 0.10490 0.07174 0.2642 0.06953
546 10.320 16.35 65.31 324.9 0.09434 0.04994 0.010120 0.005495 0.1885 0.06201 ... 11.250 21.77 71.12 384.9 0.12850 0.08842 0.04384 0.02381 0.2681 0.07399
547 10.260 16.58 65.85 320.8 0.08877 0.08066 0.043580 0.024380 0.1669 0.06714 ... 10.830 22.04 71.08 357.4 0.14610 0.22460 0.17830 0.08333 0.2691 0.09479
548 9.683 19.34 61.05 285.7 0.08491 0.05030 0.023370 0.009615 0.1580 0.06235 ... 10.930 25.59 69.10 364.2 0.11990 0.09546 0.09350 0.03846 0.2552 0.07920
549 10.820 24.21 68.89 361.6 0.08192 0.06602 0.015480 0.008160 0.1976 0.06328 ... 13.030 31.45 83.90 505.6 0.12040 0.16330 0.06194 0.03264 0.3059 0.07626
550 10.860 21.48 68.51 360.5 0.07431 0.04227 0.000000 0.000000 0.1661 0.05948 ... 11.660 24.77 74.08 412.3 0.10010 0.07348 0.00000 0.00000 0.2458 0.06592
551 11.130 22.44 71.49 378.4 0.09566 0.08194 0.048240 0.022570 0.2030 0.06552 ... 12.020 28.26 77.80 436.6 0.10870 0.17820 0.15640 0.06413 0.3169 0.08032
552 12.770 29.43 81.35 507.9 0.08276 0.04234 0.019970 0.014990 0.1539 0.05637 ... 13.870 36.00 88.10 594.7 0.12340 0.10640 0.08653 0.06498 0.2407 0.06484
553 9.333 21.94 59.01 264.0 0.09240 0.05605 0.039960 0.012820 0.1692 0.06576 ... 9.845 25.05 62.86 295.8 0.11030 0.08298 0.07993 0.02564 0.2435 0.07393
554 12.880 28.92 82.50 514.3 0.08123 0.05824 0.061950 0.023430 0.1566 0.05708 ... 13.890 35.74 88.84 595.7 0.12270 0.16200 0.24390 0.06493 0.2372 0.07242
555 10.290 27.61 65.67 321.4 0.09030 0.07658 0.059990 0.027380 0.1593 0.06127 ... 10.840 34.91 69.57 357.6 0.13840 0.17100 0.20000 0.09127 0.2226 0.08283
556 10.160 19.59 64.73 311.7 0.10030 0.07504 0.005025 0.011160 0.1791 0.06331 ... 10.650 22.88 67.88 347.3 0.12650 0.12000 0.01005 0.02232 0.2262 0.06742
557 9.423 27.88 59.26 271.3 0.08123 0.04971 0.000000 0.000000 0.1742 0.06059 ... 10.490 34.24 66.50 330.6 0.10730 0.07158 0.00000 0.00000 0.2475 0.06969
558 14.590 22.68 96.39 657.1 0.08473 0.13300 0.102900 0.037360 0.1454 0.06147 ... 15.480 27.27 105.90 733.5 0.10260 0.31710 0.36620 0.11050 0.2258 0.08004
559 11.510 23.93 74.52 403.5 0.09261 0.10210 0.111200 0.041050 0.1388 0.06570 ... 12.480 37.16 82.28 474.2 0.12980 0.25170 0.36300 0.09653 0.2112 0.08732
560 14.050 27.15 91.38 600.4 0.09929 0.11260 0.044620 0.043040 0.1537 0.06171 ... 15.300 33.17 100.20 706.7 0.12410 0.22640 0.13260 0.10480 0.2250 0.08321
561 11.200 29.37 70.67 386.0 0.07449 0.03558 0.000000 0.000000 0.1060 0.05502 ... 11.920 38.30 75.19 439.6 0.09267 0.05494 0.00000 0.00000 0.1566 0.05905
562 15.220 30.62 103.40 716.9 0.10480 0.20870 0.255000 0.094290 0.2128 0.07152 ... 17.520 42.79 128.70 915.0 0.14170 0.79170 1.17000 0.23560 0.4089 0.14090
563 20.920 25.09 143.00 1347.0 0.10990 0.22360 0.317400 0.147400 0.2149 0.06879 ... 24.290 29.41 179.10 1819.0 0.14070 0.41860 0.65990 0.25420 0.2929 0.09873
564 21.560 22.39 142.00 1479.0 0.11100 0.11590 0.243900 0.138900 0.1726 0.05623 ... 25.450 26.40 166.10 2027.0 0.14100 0.21130 0.41070 0.22160 0.2060 0.07115
565 20.130 28.25 131.20 1261.0 0.09780 0.10340 0.144000 0.097910 0.1752 0.05533 ... 23.690 38.25 155.00 1731.0 0.11660 0.19220 0.32150 0.16280 0.2572 0.06637
566 16.600 28.08 108.30 858.1 0.08455 0.10230 0.092510 0.053020 0.1590 0.05648 ... 18.980 34.12 126.70 1124.0 0.11390 0.30940 0.34030 0.14180 0.2218 0.07820
567 20.600 29.33 140.10 1265.0 0.11780 0.27700 0.351400 0.152000 0.2397 0.07016 ... 25.740 39.42 184.60 1821.0 0.16500 0.86810 0.93870 0.26500 0.4087 0.12400
568 7.760 24.54 47.92 181.0 0.05263 0.04362 0.000000 0.000000 0.1587 0.05884 ... 9.456 30.37 59.16 268.6 0.08996 0.06444 0.00000 0.00000 0.2871 0.07039

569 rows × 30 columns


In [26]:
def answer_three():
    cancerdf = answer_one()
    
    X= cancerdf.iloc[:, :-1]
    y= cancerdf['target']
    
    return X, y

Question 4

Using train_test_split, split X and y into training and test sets (X_train, X_test, y_train, and y_test).

Set the random number generator state to 0 using random_state=0 to make sure your results match the autograder!

This function should return a tuple of length 4: (X_train, X_test, y_train, y_test), where

  • X_train has shape (426, 30)
  • X_test has shape (143, 30)
  • y_train has shape (426,)
  • y_test has shape (143,)

In [27]:
from sklearn.model_selection import train_test_split

def answer_four():
    X, y = answer_three()
    
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25 , random_state=0)
    
    return X_train, X_test, y_train, y_test

answer_four()


Out[27]:
(     mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
 293       11.850         17.46           75.54      432.7          0.08372   
 332       11.220         19.86           71.94      387.3          0.10540   
 565       20.130         28.25          131.20     1261.0          0.09780   
 278       13.590         17.84           86.24      572.3          0.07948   
 489       16.690         20.20          107.10      857.6          0.07497   
 346       12.060         18.90           76.66      445.3          0.08386   
 357       13.870         16.21           88.52      593.7          0.08743   
 355       12.560         19.07           81.92      485.8          0.08760   
 112       14.260         19.65           97.83      629.9          0.07837   
 68         9.029         17.33           58.79      250.5          0.10660   
 526       13.460         18.75           87.44      551.1          0.10750   
 206        9.876         17.27           62.92      295.4          0.10890   
 65        14.780         23.94           97.40      668.3          0.11720   
 437       14.040         15.98           89.78      611.2          0.08458   
 126       13.610         24.69           87.76      572.6          0.09258   
 429       12.720         17.67           80.98      501.3          0.07896   
 392       15.490         19.97          102.40      744.7          0.11600   
 343       19.680         21.68          129.90     1194.0          0.09797   
 334       12.300         19.02           77.88      464.4          0.08313   
 440       10.970         17.20           71.73      371.5          0.08915   
 441       17.270         25.42          112.40      928.8          0.08331   
 137       11.430         15.39           73.06      399.8          0.09639   
 230       17.050         19.08          113.40      895.0          0.11410   
 7         13.710         20.83           90.20      577.9          0.11890   
 408       17.990         20.66          117.80      991.7          0.10360   
 523       13.710         18.68           88.73      571.0          0.09916   
 361       13.300         21.57           85.24      546.1          0.08582   
 553        9.333         21.94           59.01      264.0          0.09240   
 478       11.490         14.59           73.99      404.9          0.10460   
 303       10.490         18.61           66.86      334.3          0.10680   
 ..           ...           ...             ...        ...              ...   
 459        9.755         28.20           61.68      290.9          0.07984   
 510       11.740         14.69           76.31      426.0          0.08099   
 151        8.219         20.70           53.27      203.9          0.09405   
 244       19.400         23.50          129.10     1155.0          0.10270   
 543       13.210         28.06           84.88      538.4          0.08671   
 544       13.870         20.70           89.77      584.8          0.09578   
 265       20.730         31.12          135.70     1419.0          0.09469   
 288       11.260         19.96           73.72      394.1          0.08020   
 423       13.660         19.13           89.46      575.3          0.09057   
 147       14.950         18.77           97.84      689.5          0.08138   
 177       16.460         20.11          109.30      832.9          0.09831   
 99        14.420         19.77           94.48      642.5          0.09752   
 448       14.530         19.34           94.25      659.7          0.08388   
 431       12.400         17.68           81.47      467.8          0.10540   
 115       11.930         21.53           76.53      438.6          0.09768   
 72        17.200         24.52          114.20      929.4          0.10710   
 537       11.690         24.44           76.37      406.4          0.12360   
 174       10.660         15.15           67.49      349.6          0.08792   
 87        19.020         24.59          122.00     1076.0          0.09029   
 551       11.130         22.44           71.49      378.4          0.09566   
 486       14.640         16.85           94.21      666.0          0.08641   
 314        8.597         18.60           54.09      221.2          0.10740   
 396       13.510         18.89           88.10      558.1          0.10590   
 472       14.920         14.93           96.45      686.9          0.08098   
 70        18.940         21.31          123.60     1130.0          0.09009   
 277       18.810         19.98          120.90     1102.0          0.08923   
 9         12.460         24.04           83.97      475.9          0.11860   
 359        9.436         18.32           59.82      278.6          0.10090   
 192        9.720         18.22           60.73      288.1          0.06950   
 559       11.510         23.93           74.52      403.5          0.09261   
 
      mean compactness  mean concavity  mean concave points  mean symmetry  \
 293           0.05642        0.026880             0.022800         0.1875   
 332           0.06779        0.005006             0.007583         0.1940   
 565           0.10340        0.144000             0.097910         0.1752   
 278           0.04052        0.019970             0.012380         0.1573   
 489           0.07112        0.036490             0.023070         0.1846   
 346           0.05794        0.007510             0.008488         0.1555   
 357           0.05492        0.015020             0.020880         0.1424   
 355           0.10380        0.103000             0.043910         0.1533   
 112           0.22330        0.300300             0.077980         0.1704   
 68            0.14130        0.313000             0.043750         0.2111   
 526           0.11380        0.042010             0.031520         0.1723   
 206           0.07232        0.017560             0.019520         0.1934   
 65            0.14790        0.126700             0.090290         0.1953   
 437           0.05895        0.035340             0.029440         0.1714   
 126           0.07862        0.052850             0.030850         0.1761   
 429           0.04522        0.014020             0.018350         0.1459   
 392           0.15620        0.189100             0.091130         0.1929   
 343           0.13390        0.186300             0.110300         0.2082   
 334           0.04202        0.007756             0.008535         0.1539   
 440           0.11130        0.094570             0.036130         0.1489   
 441           0.11090        0.120400             0.057360         0.1467   
 137           0.06889        0.035030             0.028750         0.1734   
 230           0.15720        0.191000             0.109000         0.2131   
 7             0.16450        0.093660             0.059850         0.2196   
 408           0.13040        0.120100             0.088240         0.1992   
 523           0.10700        0.053850             0.037830         0.1714   
 361           0.06373        0.033440             0.024240         0.1815   
 553           0.05605        0.039960             0.012820         0.1692   
 478           0.08228        0.053080             0.019690         0.1779   
 303           0.06678        0.022970             0.017800         0.1482   
 ..                ...             ...                  ...            ...   
 459           0.04626        0.015410             0.010430         0.1621   
 510           0.09661        0.067260             0.026390         0.1499   
 151           0.13050        0.132100             0.021680         0.2222   
 244           0.15580        0.204900             0.088860         0.1978   
 543           0.06877        0.029870             0.032750         0.1628   
 544           0.10180        0.036880             0.023690         0.1620   
 265           0.11430        0.136700             0.086460         0.1769   
 288           0.11810        0.092740             0.055880         0.2595   
 423           0.11470        0.096570             0.048120         0.1848   
 147           0.11670        0.090500             0.035620         0.1744   
 177           0.15560        0.179300             0.088660         0.1794   
 99            0.11410        0.093880             0.058390         0.1879   
 448           0.07800        0.088170             0.029250         0.1473   
 431           0.13160        0.077410             0.027990         0.1811   
 115           0.07849        0.033280             0.020080         0.1688   
 72            0.18300        0.169200             0.079440         0.1927   
 537           0.15520        0.045150             0.045310         0.2131   
 174           0.04302        0.000000             0.000000         0.1928   
 87            0.12060        0.146800             0.082710         0.1953   
 551           0.08194        0.048240             0.022570         0.2030   
 486           0.06698        0.051920             0.027910         0.1409   
 314           0.05847        0.000000             0.000000         0.2163   
 396           0.11470        0.085800             0.053810         0.1806   
 472           0.08549        0.055390             0.032210         0.1687   
 70            0.10290        0.108000             0.079510         0.1582   
 277           0.05884        0.080200             0.058430         0.1550   
 9             0.23960        0.227300             0.085430         0.2030   
 359           0.05956        0.027100             0.014060         0.1506   
 192           0.02344        0.000000             0.000000         0.1653   
 559           0.10210        0.111200             0.041050         0.1388   
 
      mean fractal dimension           ...             worst radius  \
 293                 0.05715           ...                   13.060   
 332                 0.06028           ...                   11.980   
 565                 0.05533           ...                   23.690   
 278                 0.05520           ...                   15.500   
 489                 0.05325           ...                   19.180   
 346                 0.06048           ...                   13.640   
 357                 0.05883           ...                   15.110   
 355                 0.06184           ...                   13.370   
 112                 0.07769           ...                   15.300   
 68                  0.08046           ...                   10.310   
 526                 0.06317           ...                   15.350   
 206                 0.06285           ...                   10.420   
 65                  0.06654           ...                   17.310   
 437                 0.05898           ...                   15.660   
 126                 0.06130           ...                   16.890   
 429                 0.05544           ...                   13.820   
 392                 0.06744           ...                   21.200   
 343                 0.05715           ...                   22.750   
 334                 0.05945           ...                   13.350   
 440                 0.06640           ...                   12.360   
 441                 0.05407           ...                   20.380   
 137                 0.05865           ...                   12.320   
 230                 0.06325           ...                   19.590   
 7                   0.07451           ...                   17.060   
 408                 0.06069           ...                   21.080   
 523                 0.06843           ...                   15.110   
 361                 0.05696           ...                   14.200   
 553                 0.06576           ...                    9.845   
 478                 0.06574           ...                   12.400   
 303                 0.06600           ...                   11.060   
 ..                      ...           ...                      ...   
 459                 0.05952           ...                   10.670   
 510                 0.06758           ...                   12.450   
 151                 0.08261           ...                    9.092   
 244                 0.06000           ...                   21.650   
 543                 0.05781           ...                   14.370   
 544                 0.06688           ...                   15.050   
 265                 0.05674           ...                   32.490   
 288                 0.06233           ...                   11.860   
 423                 0.06181           ...                   15.140   
 147                 0.06493           ...                   16.250   
 177                 0.06323           ...                   17.790   
 99                  0.06390           ...                   16.330   
 448                 0.05746           ...                   16.300   
 431                 0.07102           ...                   12.880   
 115                 0.06194           ...                   13.670   
 72                  0.06487           ...                   23.320   
 537                 0.07405           ...                   12.980   
 174                 0.05975           ...                   11.540   
 87                  0.05629           ...                   24.560   
 551                 0.06552           ...                   12.020   
 486                 0.05355           ...                   16.460   
 314                 0.07359           ...                    8.952   
 396                 0.06079           ...                   14.800   
 472                 0.05669           ...                   17.180   
 70                  0.05461           ...                   24.860   
 277                 0.04996           ...                   19.960   
 9                   0.08243           ...                   15.090   
 359                 0.06959           ...                   12.020   
 192                 0.06447           ...                    9.968   
 559                 0.06570           ...                   12.480   
 
      worst texture  worst perimeter  worst area  worst smoothness  \
 293          25.75            84.35       517.8           0.13690   
 332          25.78            76.91       436.1           0.14240   
 565          38.25           155.00      1731.0           0.11660   
 278          26.10            98.91       739.1           0.10500   
 489          26.56           127.30      1084.0           0.10090   
 346          27.06            86.54       562.6           0.12890   
 357          25.58            96.74       694.4           0.11530   
 355          22.43            89.02       547.4           0.10960   
 112          23.73           107.00       709.0           0.08949   
 68           22.65            65.50       324.7           0.14820   
 526          25.16           101.90       719.8           0.16240   
 206          23.22            67.08       331.6           0.14150   
 65           33.39           114.60       925.1           0.16480   
 437          21.58           101.20       750.0           0.11950   
 126          35.64           113.20       848.7           0.14710   
 429          20.96            88.87       586.8           0.10680   
 392          29.41           142.10      1359.0           0.16810   
 343          34.66           157.60      1540.0           0.12180   
 334          28.46            84.53       544.3           0.12220   
 440          26.87            90.14       476.4           0.13910   
 441          35.46           132.80      1284.0           0.14360   
 137          22.02            79.93       462.0           0.11900   
 230          24.89           133.50      1189.0           0.17030   
 7            28.14           110.60       897.0           0.16540   
 408          25.41           138.10      1349.0           0.14820   
 523          25.63            99.43       701.9           0.14250   
 361          29.20            92.94       621.2           0.11400   
 553          25.05            62.86       295.8           0.11030   
 478          21.90            82.04       467.6           0.13520   
 303          24.54            70.76       375.4           0.14130   
 ..             ...              ...         ...               ...   
 459          36.92            68.03       349.9           0.11100   
 510          17.60            81.25       473.8           0.10730   
 151          29.72            58.08       249.8           0.16300   
 244          30.53           144.90      1417.0           0.14630   
 543          37.17            92.48       629.6           0.10720   
 544          24.75            99.17       688.6           0.12640   
 265          47.16           214.00      3432.0           0.14010   
 288          22.33            78.27       437.6           0.10280   
 423          25.50           101.40       708.8           0.11470   
 147          25.47           107.10       809.7           0.09970   
 177          28.45           123.50       981.2           0.14150   
 99           30.86           109.50       826.4           0.14310   
 448          28.39           108.10       830.5           0.10890   
 431          22.91            89.61       515.8           0.14500   
 115          26.15            87.54       583.0           0.15000   
 72           33.82           151.60      1681.0           0.15850   
 537          32.19            86.12       487.7           0.17680   
 174          19.20            73.20       408.3           0.10760   
 87           30.41           152.90      1623.0           0.12490   
 551          28.26            77.80       436.6           0.10870   
 486          25.44           106.00       831.0           0.11420   
 314          22.44            56.65       240.1           0.13470   
 396          27.20            97.33       675.2           0.14280   
 472          18.22           112.00       906.6           0.10650   
 70           26.58           165.90      1866.0           0.11930   
 277          24.30           129.00      1236.0           0.12430   
 9            40.68            97.65       711.4           0.18530   
 359          25.02            75.79       439.6           0.13330   
 192          20.83            62.25       303.8           0.07117   
 559          37.16            82.28       474.2           0.12980   
 
      worst compactness  worst concavity  worst concave points  worst symmetry  \
 293            0.17580          0.13160               0.09140          0.3101   
 332            0.09669          0.01335               0.02022          0.3292   
 565            0.19220          0.32150               0.16280          0.2572   
 278            0.07622          0.10600               0.05185          0.2335   
 489            0.29200          0.24770               0.08737          0.4677   
 346            0.13520          0.04506               0.05093          0.2880   
 357            0.10080          0.05285               0.05556          0.2362   
 355            0.20020          0.23880               0.09265          0.2121   
 112            0.41930          0.67830               0.15050          0.2398   
 68             0.43650          1.25200               0.17500          0.4228   
 526            0.31240          0.26540               0.14270          0.3518   
 206            0.12470          0.06213               0.05588          0.2989   
 65             0.34160          0.30240               0.16140          0.3321   
 437            0.12520          0.11170               0.07453          0.2725   
 126            0.28840          0.37960               0.13290          0.3470   
 429            0.09605          0.03469               0.03612          0.2165   
 392            0.39130          0.55530               0.21210          0.3187   
 343            0.34580          0.47340               0.22550          0.4045   
 334            0.09052          0.03619               0.03983          0.2554   
 440            0.40820          0.47790               0.15550          0.2540   
 441            0.41220          0.50360               0.17390          0.2500   
 137            0.16480          0.13990               0.08476          0.2676   
 230            0.39340          0.50180               0.25430          0.3109   
 7              0.36820          0.26780               0.15560          0.3196   
 408            0.37350          0.33010               0.19740          0.3060   
 523            0.25660          0.19350               0.12840          0.2849   
 361            0.16670          0.12120               0.05614          0.2637   
 553            0.08298          0.07993               0.02564          0.2435   
 478            0.20100          0.25960               0.07431          0.2941   
 303            0.10440          0.08423               0.06528          0.2213   
 ..                 ...              ...                   ...             ...   
 459            0.11090          0.07190               0.04866          0.2321   
 510            0.27930          0.26900               0.10560          0.2604   
 151            0.43100          0.53810               0.07879          0.3322   
 244            0.29680          0.34580               0.15640          0.2920   
 543            0.13810          0.10620               0.07958          0.2473   
 544            0.20370          0.13770               0.06845          0.2249   
 265            0.26440          0.34420               0.16590          0.2868   
 288            0.18430          0.15460               0.09314          0.2955   
 423            0.31670          0.36600               0.14070          0.2744   
 147            0.25210          0.25000               0.08405          0.2852   
 177            0.46670          0.58620               0.20350          0.3054   
 99             0.30260          0.31940               0.15650          0.2718   
 448            0.26490          0.37790               0.09594          0.2471   
 431            0.26290          0.24030               0.07370          0.2556   
 115            0.23990          0.15030               0.07247          0.2438   
 72             0.73940          0.65660               0.18990          0.3313   
 537            0.32510          0.13950               0.13080          0.2803   
 174            0.06791          0.00000               0.00000          0.2710   
 87             0.32060          0.57550               0.19560          0.3956   
 551            0.17820          0.15640               0.06413          0.3169   
 486            0.20700          0.24370               0.07828          0.2455   
 314            0.07767          0.00000               0.00000          0.3142   
 396            0.25700          0.34380               0.14530          0.2666   
 472            0.27910          0.31510               0.11470          0.2688   
 70             0.23360          0.26870               0.17890          0.2551   
 277            0.11600          0.22100               0.12940          0.2567   
 9              1.05800          1.10500               0.22100          0.4366   
 359            0.10490          0.11440               0.05052          0.2454   
 192            0.02729          0.00000               0.00000          0.1909   
 559            0.25170          0.36300               0.09653          0.2112   
 
      worst fractal dimension  
 293                  0.07007  
 332                  0.06522  
 565                  0.06637  
 278                  0.06263  
 489                  0.07623  
 346                  0.08083  
 357                  0.07113  
 355                  0.07188  
 112                  0.10820  
 68                   0.11750  
 526                  0.08665  
 206                  0.07380  
 65                   0.08911  
 437                  0.07234  
 126                  0.07900  
 429                  0.06025  
 392                  0.10190  
 343                  0.07918  
 334                  0.07207  
 440                  0.09532  
 441                  0.07944  
 137                  0.06765  
 230                  0.09061  
 7                    0.11510  
 408                  0.08503  
 523                  0.09031  
 361                  0.06658  
 553                  0.07393  
 478                  0.09180  
 303                  0.07842  
 ..                       ...  
 459                  0.07211  
 510                  0.09879  
 151                  0.14860  
 244                  0.07614  
 543                  0.06443  
 544                  0.08492  
 265                  0.08218  
 288                  0.07009  
 423                  0.08839  
 147                  0.09218  
 177                  0.09519  
 99                   0.09353  
 448                  0.07463  
 431                  0.09359  
 115                  0.08541  
 72                   0.13390  
 537                  0.09970  
 174                  0.06164  
 87                   0.09288  
 551                  0.08032  
 486                  0.06596  
 314                  0.08116  
 396                  0.07686  
 472                  0.08273  
 70                   0.06589  
 277                  0.05737  
 9                    0.20750  
 359                  0.08136  
 192                  0.06559  
 559                  0.08732  
 
 [426 rows x 30 columns],
      mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
 512       13.400         20.52           88.64      556.7          0.11060   
 457       13.210         25.25           84.10      537.9          0.08791   
 439       14.020         15.66           89.59      606.5          0.07966   
 298       14.260         18.17           91.22      633.1          0.06576   
 37        13.030         18.42           82.61      523.8          0.08983   
 515       11.340         18.61           72.76      391.2          0.10490   
 382       12.050         22.72           78.75      447.8          0.06935   
 310       11.700         19.11           74.33      418.7          0.08814   
 538        7.729         25.49           47.98      178.8          0.08098   
 345       10.260         14.71           66.20      321.6          0.09882   
 421       14.690         13.98           98.22      656.1          0.10310   
 90        14.620         24.02           94.57      662.7          0.08974   
 412        9.397         21.68           59.75      268.8          0.07969   
 157       16.840         19.46          108.40      880.2          0.07445   
 89        14.640         15.24           95.77      651.9          0.11320   
 172       15.460         11.89          102.50      736.9          0.12570   
 318        9.042         18.90           60.07      244.5          0.09968   
 233       20.510         27.81          134.40     1319.0          0.09159   
 389       19.550         23.21          128.90     1174.0          0.10100   
 250       20.940         23.56          138.90     1364.0          0.10070   
 31        11.840         18.70           77.93      440.6          0.11090   
 283       16.240         18.77          108.80      805.1          0.10660   
 482       13.470         14.06           87.32      546.3          0.10710   
 211       11.840         18.94           75.51      428.0          0.08871   
 372       21.370         15.10          141.30     1386.0          0.10010   
 401       11.930         10.91           76.14      442.7          0.08872   
 159       10.900         12.96           68.69      366.8          0.07515   
 14        13.730         22.61           93.60      578.3          0.11310   
 364       13.400         16.95           85.48      552.4          0.07937   
 337       18.770         21.43          122.90     1092.0          0.09116   
 ..           ...           ...             ...        ...              ...   
 500       15.040         16.74           98.73      689.4          0.09883   
 338       10.050         17.53           64.41      310.8          0.10070   
 427       10.800         21.98           68.79      359.9          0.08801   
 406       16.140         14.86          104.30      800.0          0.09495   
 96        12.180         17.84           77.79      451.1          0.10450   
 490       12.250         22.44           78.18      466.5          0.08192   
 384       13.280         13.72           85.79      541.8          0.08363   
 281       11.740         14.02           74.24      427.3          0.07813   
 325       12.670         17.30           81.25      489.9          0.10280   
 190       14.220         23.12           94.37      609.9          0.10750   
 380       11.270         12.96           73.16      386.3          0.12370   
 366       20.200         26.83          133.70     1234.0          0.09905   
 469       11.620         18.18           76.38      408.8          0.11750   
 225       14.340         13.47           92.51      641.2          0.09906   
 271       11.290         13.04           72.23      388.0          0.09834   
 547       10.260         16.58           65.85      320.8          0.08877   
 550       10.860         21.48           68.51      360.5          0.07431   
 492       18.010         20.56          118.40     1007.0          0.10010   
 185       10.080         15.11           63.76      317.5          0.09267   
 306       13.200         15.82           84.07      537.3          0.08511   
 208       13.110         22.54           87.02      529.4          0.10020   
 242       11.300         18.19           73.93      389.4          0.09592   
 313       11.540         10.72           73.73      409.1          0.08597   
 542       14.740         25.42           94.70      668.6          0.08275   
 514       15.050         19.07           97.26      701.9          0.09215   
 236       23.210         26.97          153.50     1670.0          0.09509   
 113       10.510         20.19           68.64      334.2          0.11220   
 527       12.340         12.27           78.94      468.5          0.09003   
 76        13.530         10.94           87.91      559.2          0.12910   
 162       19.590         18.15          130.70     1214.0          0.11200   
 
      mean compactness  mean concavity  mean concave points  mean symmetry  \
 512           0.14690        0.144500             0.081720         0.2116   
 457           0.05205        0.027720             0.020680         0.1619   
 439           0.05581        0.020870             0.026520         0.1589   
 298           0.05220        0.024750             0.013740         0.1635   
 37            0.03766        0.025620             0.029230         0.1467   
 515           0.08499        0.043020             0.025940         0.1927   
 382           0.10730        0.079430             0.029780         0.1203   
 310           0.05253        0.015830             0.011480         0.1936   
 538           0.04878        0.000000             0.000000         0.1870   
 345           0.09159        0.035810             0.020370         0.1633   
 421           0.18360        0.145000             0.063000         0.2086   
 90            0.08606        0.031020             0.029570         0.1685   
 412           0.06053        0.037350             0.005128         0.1274   
 157           0.07223        0.051500             0.027710         0.1844   
 89            0.13390        0.099660             0.070640         0.2116   
 172           0.15550        0.203200             0.109700         0.1966   
 318           0.19720        0.197500             0.049080         0.2330   
 233           0.10740        0.155400             0.083400         0.1448   
 389           0.13180        0.185600             0.102100         0.1989   
 250           0.16060        0.271200             0.131000         0.2205   
 31            0.15160        0.121800             0.051820         0.2301   
 283           0.18020        0.194800             0.090520         0.1876   
 482           0.11550        0.057860             0.052660         0.1779   
 211           0.06900        0.026690             0.013930         0.1533   
 372           0.15150        0.193200             0.125500         0.1973   
 401           0.05242        0.026060             0.017960         0.1601   
 159           0.03718        0.003090             0.006588         0.1442   
 14            0.22930        0.212800             0.080250         0.2069   
 364           0.05696        0.021810             0.014730         0.1650   
 337           0.14020        0.106000             0.060900         0.1953   
 ..                ...             ...                  ...            ...   
 500           0.13640        0.077210             0.061420         0.1668   
 338           0.07326        0.025110             0.017750         0.1890   
 427           0.05743        0.036140             0.014040         0.2016   
 406           0.08501        0.055000             0.045280         0.1735   
 96            0.07057        0.024900             0.029410         0.1900   
 490           0.05200        0.017140             0.012610         0.1544   
 384           0.08575        0.050770             0.028640         0.1617   
 281           0.04340        0.022450             0.027630         0.2101   
 325           0.07664        0.031930             0.021070         0.1707   
 190           0.24130        0.198100             0.066180         0.2384   
 380           0.11110        0.079000             0.055500         0.2018   
 366           0.16690        0.164100             0.126500         0.1875   
 469           0.14830        0.102000             0.055640         0.1957   
 225           0.07624        0.057240             0.046030         0.2075   
 271           0.07608        0.032650             0.027550         0.1769   
 547           0.08066        0.043580             0.024380         0.1669   
 550           0.04227        0.000000             0.000000         0.1661   
 492           0.12890        0.117000             0.077620         0.2116   
 185           0.04695        0.001597             0.002404         0.1703   
 306           0.05251        0.001461             0.003261         0.1632   
 208           0.14830        0.087050             0.051020         0.1850   
 242           0.13250        0.154800             0.028540         0.2054   
 313           0.05969        0.013670             0.008907         0.1833   
 542           0.07214        0.041050             0.030270         0.1840   
 514           0.08597        0.074860             0.043350         0.1561   
 236           0.16820        0.195000             0.123700         0.1909   
 113           0.13030        0.064760             0.030680         0.1922   
 527           0.06307        0.029580             0.026470         0.1689   
 76            0.10470        0.068770             0.065560         0.2403   
 162           0.16660        0.250800             0.128600         0.2027   
 
      mean fractal dimension           ...             worst radius  \
 512                 0.07325           ...                   16.410   
 457                 0.05584           ...                   14.350   
 439                 0.05586           ...                   14.910   
 298                 0.05586           ...                   16.220   
 37                  0.05863           ...                   13.300   
 515                 0.06211           ...                   12.470   
 382                 0.06659           ...                   12.570   
 310                 0.06128           ...                   12.610   
 538                 0.07285           ...                    9.077   
 345                 0.07005           ...                   10.880   
 421                 0.07406           ...                   16.460   
 90                  0.05866           ...                   16.110   
 412                 0.06724           ...                    9.965   
 157                 0.05268           ...                   18.220   
 89                  0.06346           ...                   16.340   
 172                 0.07069           ...                   18.790   
 318                 0.08743           ...                   10.060   
 233                 0.05592           ...                   24.470   
 389                 0.05884           ...                   20.820   
 250                 0.05898           ...                   25.580   
 31                  0.07799           ...                   16.820   
 283                 0.06684           ...                   18.550   
 482                 0.06639           ...                   14.830   
 211                 0.06057           ...                   13.300   
 372                 0.06183           ...                   22.690   
 401                 0.05541           ...                   13.800   
 159                 0.05743           ...                   12.360   
 14                  0.07682           ...                   15.030   
 364                 0.05701           ...                   14.730   
 337                 0.06083           ...                   24.540   
 ..                      ...           ...                      ...   
 500                 0.06869           ...                   16.760   
 338                 0.06331           ...                   11.160   
 427                 0.05977           ...                   12.760   
 406                 0.05875           ...                   17.710   
 96                  0.06635           ...                   12.830   
 490                 0.05976           ...                   14.170   
 384                 0.05594           ...                   14.240   
 281                 0.06113           ...                   13.310   
 325                 0.05984           ...                   13.710   
 190                 0.07542           ...                   15.740   
 380                 0.06914           ...                   12.840   
 366                 0.06020           ...                   24.190   
 469                 0.07255           ...                   13.360   
 225                 0.05448           ...                   16.770   
 271                 0.06270           ...                   12.320   
 547                 0.06714           ...                   10.830   
 550                 0.05948           ...                   11.660   
 492                 0.06077           ...                   21.530   
 185                 0.06048           ...                   11.870   
 306                 0.05894           ...                   14.410   
 208                 0.07310           ...                   14.550   
 242                 0.07669           ...                   12.580   
 313                 0.06100           ...                   12.340   
 542                 0.05680           ...                   16.510   
 514                 0.05915           ...                   17.580   
 236                 0.06309           ...                   31.010   
 113                 0.07782           ...                   11.160   
 527                 0.05808           ...                   13.610   
 76                  0.06641           ...                   14.080   
 162                 0.06082           ...                   26.730   
 
      worst texture  worst perimeter  worst area  worst smoothness  \
 512          29.66           113.30       844.4           0.15740   
 457          34.23            91.29       632.9           0.12890   
 439          19.31            96.53       688.9           0.10340   
 298          25.26           105.80       819.7           0.09445   
 37           22.81            84.46       545.9           0.09701   
 515          23.03            79.15       478.6           0.14830   
 382          28.71            87.36       488.4           0.08799   
 310          26.55            80.92       483.1           0.12230   
 538          30.92            57.17       248.0           0.12560   
 345          19.48            70.89       357.1           0.13600   
 421          18.34           114.10       809.2           0.13120   
 90           29.11           102.90       803.7           0.11150   
 412          27.99            66.61       301.0           0.10860   
 157          28.07           120.30      1032.0           0.08774   
 89           18.24           109.40       803.6           0.12770   
 172          17.04           125.00      1102.0           0.15310   
 318          23.40            68.62       297.1           0.12210   
 233          37.38           162.70      1872.0           0.12230   
 389          30.44           142.00      1313.0           0.12510   
 250          27.00           165.30      2010.0           0.12110   
 31           28.12           119.40       888.7           0.16370   
 283          25.09           126.90      1031.0           0.13650   
 482          18.32            94.94       660.2           0.13930   
 211          24.99            85.22       546.3           0.12800   
 372          21.84           152.10      1535.0           0.11920   
 401          20.14            87.64       589.5           0.13740   
 159          18.20            78.07       470.0           0.11710   
 14           32.01           108.80       697.7           0.16510   
 364          21.70            93.76       663.5           0.12130   
 337          34.37           161.10      1873.0           0.14980   
 ..             ...              ...         ...               ...   
 500          20.43           109.70       856.9           0.11350   
 338          26.84            71.98       384.0           0.14020   
 427          32.04            83.69       489.5           0.13030   
 406          19.58           115.90       947.9           0.12060   
 96           20.92            82.14       495.2           0.11400   
 490          31.99            92.74       622.9           0.12560   
 384          17.37            96.59       623.7           0.11660   
 281          18.26            84.70       533.7           0.10360   
 325          21.10            88.70       574.4           0.13840   
 190          37.18           106.40       762.4           0.15330   
 380          20.53            84.93       476.1           0.16100   
 366          33.81           160.00      1671.0           0.12780   
 469          25.40            88.14       528.1           0.17800   
 225          16.90           110.40       873.2           0.12970   
 271          16.18            78.27       457.5           0.13580   
 547          22.04            71.08       357.4           0.14610   
 550          24.77            74.08       412.3           0.10010   
 492          26.06           143.40      1426.0           0.13090   
 185          21.18            75.39       437.0           0.15210   
 306          20.45            92.00       636.9           0.11280   
 208          29.16            99.48       639.3           0.13490   
 242          27.96            87.16       472.9           0.13470   
 313          12.87            81.23       467.8           0.10920   
 542          32.29           107.40       826.4           0.10600   
 514          28.06           113.80       967.0           0.12460   
 236          34.51           206.00      2944.0           0.14810   
 113          22.75            72.62       374.4           0.13000   
 527          19.27            87.22       564.9           0.12920   
 76           12.49            91.36       605.5           0.14510   
 162          26.39           174.90      2232.0           0.14380   
 
      worst compactness  worst concavity  worst concave points  worst symmetry  \
 512            0.38560          0.51060               0.20510          0.3585   
 457            0.10630          0.13900               0.06005          0.2444   
 439            0.10170          0.06260               0.08216          0.2136   
 298            0.21670          0.15650               0.07530          0.2636   
 37             0.04619          0.04833               0.05013          0.1987   
 515            0.15740          0.16240               0.08542          0.3060   
 382            0.32140          0.29120               0.10920          0.2191   
 310            0.10870          0.07915               0.05741          0.3487   
 538            0.08340          0.00000               0.00000          0.3058   
 345            0.16360          0.07162               0.04074          0.2434   
 421            0.36350          0.32190               0.11080          0.2827   
 90             0.17660          0.09189               0.06946          0.2522   
 412            0.18870          0.18680               0.02564          0.2376   
 157            0.17100          0.18820               0.08436          0.2527   
 89             0.30890          0.26040               0.13970          0.3151   
 172            0.35830          0.58300               0.18270          0.3216   
 318            0.37480          0.46090               0.11450          0.3135   
 233            0.27610          0.41460               0.15630          0.2437   
 389            0.24140          0.38290               0.18250          0.2576   
 250            0.31720          0.69910               0.21050          0.3126   
 31             0.57750          0.69560               0.15460          0.4761   
 283            0.47060          0.50260               0.17320          0.2770   
 482            0.24990          0.18480               0.13350          0.3227   
 211            0.18800          0.14710               0.06913          0.2535   
 372            0.28400          0.40240               0.19660          0.2730   
 401            0.15750          0.15140               0.06876          0.2460   
 159            0.08294          0.01854               0.03953          0.2738   
 14             0.77250          0.69430               0.22080          0.3596   
 364            0.16760          0.13640               0.06987          0.2741   
 337            0.48270          0.46340               0.20480          0.3679   
 ..                 ...              ...                   ...             ...   
 500            0.21760          0.18560               0.10180          0.2177   
 338            0.14020          0.10550               0.06499          0.2894   
 427            0.16960          0.19270               0.07485          0.2965   
 406            0.17220          0.23100               0.11290          0.2778   
 96             0.09358          0.04980               0.05882          0.2227   
 490            0.18040          0.12300               0.06335          0.3100   
 384            0.26850          0.28660               0.09173          0.2736   
 281            0.08500          0.06735               0.08290          0.3101   
 325            0.12120          0.10200               0.05602          0.2688   
 190            0.93270          0.84880               0.17720          0.5166   
 380            0.24290          0.22470               0.13180          0.3343   
 366            0.34160          0.37030               0.21520          0.3271   
 469            0.28780          0.31860               0.14160          0.2660   
 225            0.15250          0.16320               0.10870          0.3062   
 271            0.15070          0.12750               0.08750          0.2733   
 547            0.22460          0.17830               0.08333          0.2691   
 550            0.07348          0.00000               0.00000          0.2458   
 492            0.23270          0.25440               0.14890          0.3251   
 185            0.10190          0.00692               0.01042          0.2933   
 306            0.13460          0.01120               0.02500          0.2651   
 208            0.44020          0.31620               0.11260          0.4128   
 242            0.48480          0.74360               0.12180          0.3308   
 313            0.16260          0.08324               0.04715          0.3390   
 542            0.13760          0.16110               0.10950          0.2722   
 514            0.21010          0.28660               0.11200          0.2282   
 236            0.41260          0.58200               0.25930          0.3103   
 113            0.20490          0.12950               0.06136          0.2383   
 527            0.20740          0.17910               0.10700          0.3110   
 76             0.13790          0.08539               0.07407          0.2710   
 162            0.38460          0.68100               0.22470          0.3643   
 
      worst fractal dimension  
 512                  0.11090  
 457                  0.06788  
 439                  0.06710  
 298                  0.07676  
 37                   0.06169  
 515                  0.06783  
 382                  0.09349  
 310                  0.06958  
 538                  0.09938  
 345                  0.08488  
 421                  0.09208  
 90                   0.07246  
 412                  0.09206  
 157                  0.05972  
 89                   0.08473  
 172                  0.10100  
 318                  0.10550  
 233                  0.08328  
 389                  0.07602  
 250                  0.07849  
 31                   0.14020  
 283                  0.10630  
 482                  0.09326  
 211                  0.07993  
 372                  0.08666  
 401                  0.07262  
 159                  0.07685  
 14                   0.14310  
 364                  0.07582  
 337                  0.09870  
 ..                       ...  
 500                  0.08549  
 338                  0.07664  
 427                  0.07662  
 406                  0.07012  
 96                   0.07376  
 490                  0.08203  
 384                  0.07320  
 281                  0.06688  
 325                  0.06888  
 190                  0.14460  
 380                  0.09215  
 366                  0.07632  
 469                  0.09270  
 225                  0.06072  
 271                  0.08022  
 547                  0.09479  
 550                  0.06592  
 492                  0.07625  
 185                  0.07697  
 306                  0.08385  
 208                  0.10760  
 242                  0.12970  
 313                  0.07434  
 542                  0.06956  
 514                  0.06954  
 236                  0.08677  
 113                  0.09026  
 527                  0.07592  
 76                   0.07191  
 162                  0.09223  
 
 [143 rows x 30 columns],
 293    1
 332    1
 565    0
 278    1
 489    0
 346    1
 357    1
 355    1
 112    1
 68     1
 526    1
 206    1
 65     0
 437    1
 126    0
 429    1
 392    0
 343    0
 334    1
 440    1
 441    0
 137    1
 230    0
 7      0
 408    0
 523    1
 361    1
 553    1
 478    1
 303    1
       ..
 459    1
 510    1
 151    1
 244    0
 543    1
 544    1
 265    0
 288    1
 423    1
 147    1
 177    0
 99     0
 448    1
 431    1
 115    1
 72     0
 537    1
 174    1
 87     0
 551    1
 486    1
 314    1
 396    1
 472    1
 70     0
 277    0
 9      0
 359    1
 192    1
 559    1
 Name: target, dtype: int32,
 512    0
 457    1
 439    1
 298    1
 37     1
 515    1
 382    1
 310    1
 538    1
 345    1
 421    1
 90     1
 412    1
 157    1
 89     1
 172    0
 318    1
 233    0
 389    0
 250    0
 31     0
 283    0
 482    1
 211    1
 372    0
 401    1
 159    1
 14     0
 364    1
 337    0
       ..
 500    1
 338    1
 427    1
 406    1
 96     1
 490    1
 384    1
 281    1
 325    1
 190    0
 380    1
 366    0
 469    1
 225    1
 271    1
 547    1
 550    1
 492    0
 185    1
 306    1
 208    1
 242    1
 313    1
 542    1
 514    0
 236    0
 113    1
 527    1
 76     1
 162    0
 Name: target, dtype: int32)

Question 5

Using KNeighborsClassifier, fit a k-nearest neighbors (knn) classifier with X_train, y_train and using one nearest neighbor (n_neighbors = 1).

This function should return a sklearn.neighbors.classification.KNeighborsClassifier.


In [ ]:
from sklearn.neighbors import KNeighborsClassifier

def answer_five():
    X_train, X_test, y_train, y_test = answer_four()
    
    # Your code here
    
    return # Return your answer

Question 6

Using your knn classifier, predict the class label using the mean value for each feature.

Hint: You can use cancerdf.mean()[:-1].values.reshape(1, -1) which gets the mean value for each feature, ignores the target column, and reshapes the data from 1 dimension to 2 (necessary for the precict method of KNeighborsClassifier).

This function should return a numpy array either array([ 0.]) or array([ 1.])


In [ ]:
def answer_six():
    cancerdf = answer_one()
    means = cancerdf.mean()[:-1].values.reshape(1, -1)
    
    # Your code here
    
    return # Return your answer

Question 7

Using your knn classifier, predict the class labels for the test set X_test.

This function should return a numpy array with shape (143,) and values either 0.0 or 1.0.


In [ ]:
def answer_seven():
    X_train, X_test, y_train, y_test = answer_four()
    knn = answer_five()
    
    # Your code here
    
    return # Return your answer

Question 8

Find the score (mean accuracy) of your knn classifier using X_test and y_test.

This function should return a float between 0 and 1


In [ ]:
def answer_eight():
    X_train, X_test, y_train, y_test = answer_four()
    knn = answer_five()
    
    # Your code here
    
    return # Return your answer

Optional plot

Try using the plotting function below to visualize the differet predicition scores between training and test sets, as well as malignant and benign cells.


In [ ]:
def accuracy_plot():
    import matplotlib.pyplot as plt

    %matplotlib notebook

    X_train, X_test, y_train, y_test = answer_four()

    # Find the training and testing accuracies by target value (i.e. malignant, benign)
    mal_train_X = X_train[y_train==0]
    mal_train_y = y_train[y_train==0]
    ben_train_X = X_train[y_train==1]
    ben_train_y = y_train[y_train==1]

    mal_test_X = X_test[y_test==0]
    mal_test_y = y_test[y_test==0]
    ben_test_X = X_test[y_test==1]
    ben_test_y = y_test[y_test==1]

    knn = answer_five()

    scores = [knn.score(mal_train_X, mal_train_y), knn.score(ben_train_X, ben_train_y), 
              knn.score(mal_test_X, mal_test_y), knn.score(ben_test_X, ben_test_y)]


    plt.figure()

    # Plot the scores as a bar chart
    bars = plt.bar(np.arange(4), scores, color=['#4c72b0','#4c72b0','#55a868','#55a868'])

    # directly label the score onto the bars
    for bar in bars:
        height = bar.get_height()
        plt.gca().text(bar.get_x() + bar.get_width()/2, height*.90, '{0:.{1}f}'.format(height, 2), 
                     ha='center', color='w', fontsize=11)

    # remove all the ticks (both axes), and tick labels on the Y axis
    plt.tick_params(top='off', bottom='off', left='off', right='off', labelleft='off', labelbottom='on')

    # remove the frame of the chart
    for spine in plt.gca().spines.values():
        spine.set_visible(False)

    plt.xticks([0,1,2,3], ['Malignant\nTraining', 'Benign\nTraining', 'Malignant\nTest', 'Benign\nTest'], alpha=0.8);
    plt.title('Training and Test Accuracies for Malignant and Benign Cells', alpha=0.8)

In [ ]:
# Uncomment the plotting function to see the visualization, 
# Comment out the plotting function when submitting your notebook for grading

#accuracy_plot()

In [ ]: